body{ font-family: Helvetica; font-size: 16pt; } /* Headers */ h1,h2,h3,h4,h5,h6{ font-size: 24pt; }

Breve introducción

En este documento se abordará una breve descripción relaciondada con la base de datos sobre la accidentalidad vehicular en la ciudad de Medellín entre los años 2014 y 2020, haciéndo énfasis en las variables más relevantes de esta base de datos como lo son la fecha de ocurrencia, las comunas y los barrios en los que se dan los incidentes y el tipo de accidentalidad sucedida, entre otros. Esto con el propósito de tener un acercamiento inicial a esta base de datos como parte del primer proyecto del curso de Técnicas de Aprendizaje Estadístico del semestre 2021-2 de la Universidad Nacional de Colombia, sede Medellín.

## Rows: 270,330
## Columns: 26
## $ FECHA_ACCIDENTE    <fct> 2014-07-19 15:30:00, 2014-10-25 14:50:00, 2014-11-2~
## $ AÑO                <dbl> 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 201~
## $ MES                <fct> Julio, Octubre, Noviembre, Diciembre, Diciembre, Ag~
## $ FECHA              <date> 2014-07-19, 2014-10-25, 2014-11-20, 2014-12-02, 20~
## $ HORA               <fct> 15:30:00, 14:50:00, 08:00:00, 13:00:00, 19:45:00, 1~
## $ CLASE_ACCIDENTE    <fct> Atropello, Atropello, Atropello, Atropello, Atropel~
## $ DISEÑO             <fct> Tramo de vía, Lote o predio, Lote o predio, Lote o ~
## $ GRAVEDAD_ACCIDENTE <fct> Con heridos, Con heridos, Con heridos, Con heridos,~
## $ BARRIO             <fct> Guayaquil, Guayaquil, San Benito, Corazón de Jesús,~
## $ COMUNA             <fct> , , , , , , , , , , , , , , , , , , , , , , , , , 
## $ X_MAGNA            <dbl> 820000, 820000, 820000, 820000, 820000, 820000, 820~
## $ Y_MAGNA            <dbl> 1180000, 1180000, 1180000, 1180000, 1180000, 118000~
## $ LONGITUD           <dbl> -75.70378, -75.70378, -75.70378, -75.70378, -75.703~
## $ LATITUD            <dbl> 6.221415, 6.221415, 6.221415, 6.221415, 6.221415, 6~
## $ COMUNASMOD         <chr> "La Candelaria", "La Candelaria", "La Candelaria", ~
## $ DIAX               <int> 19, 25, 20, 2, 18, 1, 4, 18, 8, 13, 26, 2, 31, 29, ~
## $ MESX               <dbl> 7, 10, 11, 12, 12, 8, 8, 8, 9, 10, 11, 9, 8, 11, 10~
## $ AÑOX               <dbl> 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 201~
## $ SEMANAX            <dbl> 29, 43, 47, 48, 51, 31, 31, 33, 36, 41, 48, 35, 35,~
## $ SEMANAXX           <chr> "29", "43", "47", "49", "51", "31", "32", "34", "37~
## $ DIA_SEMANA         <chr> "sábado", "sábado", "jueves", "martes", "jueves", "~
## $ MES_SEMANA         <chr> "julio", "octubre", "noviembre", "diciembre", "dici~
## $ FESTIVO            <dbl> 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, ~
## $ FLORES             <dbl> 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ~
## $ FUTBOL             <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ~
## $ QUINCENA           <dbl> 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, ~

Descripción general de la base de datos

La base de datos de accidentalidad de Medellín recoge todos los accidentes que sucedieron en la ciudad de Medellín, Antioquia (Colombia) entre el lunes 14 de julio de 2014 y el lunes 31 de agosto de 2020, recogiendo algunos aspectos de cada uno de estos incidentes viales como la clase de accidente observado, la dirección en la que ocurrió, el código del expediente y su número de radicado, la fecha y hora y la ubicación en coordenadas geográficas. En general, las variables a considerar por esta base de datos son las siguientes:

  • Fecha del accidente. Fecha en la que sucedió el incidente de tránsito según el Informe Policial de Accidentes de Tránsito, IPAT, en el formato YYYY-MM-DD HH:MM:SS.
  • Año. Año en el que se dio el accidente según el reporte oficial del IPAT.
  • Mes. Mes en el que se dio el accidente según el reporte oficial del IPAT descrito en palabras (ej. enero)
  • Fecha. Extracción del día, mes y año en el que se dio el incidente de tránsito según el IPAT extraído de la fecha del accidente en formato YYYY-MM-DD.
  • Hora. Extracción de la hora y el minuto en el que se dio el incidente de tránsito según el IPAT extraído de la fecha del accidente en formato HH:MM:SS.
  • Clase de accidente. Clasificación del IPAT sobre la clase de accidente de transito: choque, atropello, volcamiento, caida de ocupante, incendio, u otro (que no corresponde a las anteriores 5 clasificaciones, p. ej: sumersión).
  • Diseño. Sitio de la vía donde ocurrió el accidente: ciclorruta, glorieta, intersección, lote o predio, paso a nivel, paso elevado, paso inferior, pontón, puente, tramo de vía, túnel, vía peatonal.
  • Gravedad del accidente. Clasificación del IPAT sobre la gravedad del accidente, que corresponde al resultado más grave presentado en el accidente. Daños materiales: solo daños; accidente con heridos: hubo heridos como resultado del incidente; accidente con muertos: al menos una persona falleció como consecuencia del incidente de tránsito. No indica cantidad.
  • Barrio. Nombre del barrio o zona en la que sucedió el accidente de tránsito.
  • Comuna Comuna o corregimiento de Medellín a la que pertenece el barrio o zona en la que se ocurrió el accidente de tránsito observado conforme al registro en el IPAT.
  • X, magna. Coordenadas horizontales del punto en el que sucedió el accidente de tránsito registrado con origen en el sistema de coordenadas geográficas Magna - Medellín.
  • Y, magna. Coordenadas verticales del punto en el que sucedió el accidente de tránsito registrado con origen en el sistema de coordenadas geográficas Magna - Medellín.
  • Longitud. Coomponente de la longitud de las coordenadas geográficas del punto en el que se dio el accidente de tránsito registrado.
  • Latitud. Coomponente de la latitud de las coordenadas geográficas del punto en el que se dio el accidente de tránsito registrado.
  • Comuna modificada. Verificación de la comuna a la que pertenece un barrio o zona según los mapas oficiales de la Alcaldía de Medellín.
  • Día modificado. Componente del día de la fecha en la que se registró en el IPAD la observación de un accidente de tránsito.
  • Mes modificado. Componente del mes de la fecha en la que se registró en el IPAD la observación de un accidente de tránsito.
  • Año modificado. Componente del año de la fecha en la que se registró en el IPAD la observación de un accidente de tránsito.
  • Semana modificada uno. Número de la semana en el año en la que se dio un accidente de tránsito observado, teniendo en cuenta que la primera semana va del primero a siete de enero, la segunda va del ocho al catorce de enero y así sucesivamente sin considerar el día de la semana asociada a cada día.
  • Semana modificada dos. Número de la semana del año en la que se dio un accidente de tránsito observado considerando el día en el que comienza el año. Así, si un año comienza el día sabado, entonces el primero y el segundo de enero son la primera semana, pero el tres de enero, siendo lunes, registra una nueva semana, que en este caso es la segunda, y así sucesivamente.
  • Día semana. Nombre del día de la semana en la que se dio un accidente de tránsito observado.
  • Mes semana. Mes en el que se dio un accidente de tránsito según la fecha formalmente registrada en el IPAT.
  • Festivo. Identificación de días asociados a festivos.
  • Flores. Identificación de días asociados a la celebración de la Feria de las Flores en la ciudad.
  • Fútbol. Identificación de días en los que algún equipo local de fútbol participó en una final de fútbol de la categoría primera del país.
  • Quincena. Identificación de días en los que las empresas y las instituciones públicas y privadas pagan a sus empleados formalos sus quincenas.

Descripción general

A continuación se puede observar una descripción general de las variables más importantes de esta base de datos.

Data Frame Summary

accidentes

Dimensions: 270330 x 26
Duplicates: 347
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 FECHA_ACCIDENTE [factor]
1. (Empty string)
2. 2014-07-04 05:40:00
3. 2014-07-04 06:50:00
4. 2014-07-04 07:10:00
5. 2014-07-04 08:15:00
6. 2014-07-04 08:20:00
7. 2014-07-04 09:40:00
8. 2014-07-04 10:00:00
9. 2014-07-04 10:30:00
10. 2014-07-04 10:40:00
[ 175919 others ]
5(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
270316(100.0%)
270330 (100.0%) 0 (0.0%)
2 AÑO [numeric]
Mean (sd) : 2017 (1.8)
min ≤ med ≤ max:
2014 ≤ 2017 ≤ 2020
IQR (CV) : 3 (0)
2014:22352(8.3%)
2015:46066(17.0%)
2016:46991(17.4%)
2017:46109(17.1%)
2018:43300(16.0%)
2019:45795(16.9%)
2020:19717(7.3%)
270330 (100.0%) 0 (0.0%)
3 MES [factor]
1. Abril
2. Agosto
3. Diciembre
4. Enero
5. Febero
6. Julio
7. Junio
8. Marzo
9. Mayo
10. Noviembre
[ 2 others ]
19293(7.1%)
27001(10.0%)
23243(8.6%)
20098(7.4%)
22214(8.2%)
25018(9.3%)
20314(7.5%)
21499(8.0%)
21249(7.9%)
22319(8.3%)
48082(17.8%)
270330 (100.0%) 0 (0.0%)
4 FECHA [Date]
min : 2014-07-04
med : 2017-06-07
max : 2020-08-31
range : 6y 1m 27d
2251 distinct values 270325 (100.0%) 5 (0.0%)
5 HORA [factor]
1. (Empty string)
2. 00:00:00
3. 00:01:00
4. 00:02:00
5. 00:03:00
6. 00:04:00
7. 00:05:00
8. 00:06:00
9. 00:07:00
10. 00:08:00
[ 1419 others ]
5(0.0%)
393(0.1%)
36(0.0%)
15(0.0%)
5(0.0%)
4(0.0%)
255(0.1%)
5(0.0%)
8(0.0%)
4(0.0%)
269600(99.7%)
270330 (100.0%) 0 (0.0%)
6 CLASE_ACCIDENTE [factor]
1. (Empty string)
2. Atropello
3. Caída del ocupante
4. Choque
5. Incendio
6. Otro
7. Volcamiento
6(0.0%)
25313(9.4%)
24138(8.9%)
180431(66.7%)
35(0.0%)
30039(11.1%)
10368(3.8%)
270330 (100.0%) 0 (0.0%)
7 DISEÑO [factor]
1. (Empty string)
2. Ciclorruta
3. Glorieta
4. Intersección
5. Lote o predio
6. Paso a nivel
7. Paso elevado
8. Paso inferior
9. Pontón
10. Puente
[ 3 others ]
713(0.3%)
1040(0.4%)
6756(2.5%)
43935(16.3%)
27104(10.0%)
125(0.0%)
1399(0.5%)
678(0.3%)
34(0.0%)
1064(0.4%)
187482(69.4%)
270330 (100.0%) 0 (0.0%)
8 GRAVEDAD_ACCIDENTE [factor]
1. Con heridos
2. Con muertos
3. Solo daños
150071(55.5%)
1054(0.4%)
119205(44.1%)
270330 (100.0%) 0 (0.0%)
9 BARRIO [factor]
1. Aguas Frías
2. Aldea Pablo VI
3. Alejandría
4. Alejandro Echavarría
5. Alfonso López
6. Altamira
7. Altavista
8. Altavista Sector Central
9. Altos del Poblado
10. Andalucía
[ 306 others ]
88(0.0%)
86(0.0%)
632(0.2%)
1032(0.4%)
1168(0.4%)
778(0.3%)
372(0.1%)
257(0.1%)
329(0.1%)
267(0.1%)
265321(98.1%)
270330 (100.0%) 0 (0.0%)
10 COMUNA [factor]
1. (Empty string)
2. Aranjuez
3. Belén
4. Buenos Aires
5. Castilla
6. Corregimiento de Altavist
7. Corregimiento de San Anto
8. Corregimiento de San Cris
9. Corregimiento de San Seba
10. Corregimiento de Santa El
[ 13 others ]
16459(6.1%)
14345(5.3%)
16779(6.2%)
9869(3.7%)
24900(9.2%)
570(0.2%)
4039(1.5%)
2630(1.0%)
19(0.0%)
610(0.2%)
180110(66.6%)
270330 (100.0%) 0 (0.0%)
11 X_MAGNA [numeric]
Mean (sd) : 833003.5 (4183.6)
min ≤ med ≤ max:
820000 ≤ 834160.7 ≤ 843984.8
IQR (CV) : 2922.9 (0)
25875 distinct values 270330 (100.0%) 0 (0.0%)
12 Y_MAGNA [numeric]
Mean (sd) : 1182893 (3166.8)
min ≤ med ≤ max:
1172269 ≤ 1182902 ≤ 1196215
IQR (CV) : 4729.6 (0)
26182 distinct values 270330 (100.0%) 0 (0.0%)
13 LONGITUD [numeric]
Mean (sd) : -75.6 (0)
min ≤ med ≤ max:
-75.7 ≤ -75.6 ≤ -75.5
IQR (CV) : 0 (0)
26667 distinct values 270330 (100.0%) 0 (0.0%)
14 LATITUD [numeric]
Mean (sd) : 6.2 (0)
min ≤ med ≤ max:
6.2 ≤ 6.2 ≤ 6.4
IQR (CV) : 0 (0)
26667 distinct values 270330 (100.0%) 0 (0.0%)
15 COMUNASMOD [character]
1. La Candelaria
2. Laureles - Estadio
3. Castilla
4. El Poblado
5. Belén
6. Guayabal
7. Robledo
8. Aranjuez
9. Buenos Aires
10. La América
[ 11 others ]
67352(24.9%)
27978(10.3%)
25831(9.6%)
21736(8.0%)
18674(6.9%)
18464(6.8%)
16485(6.1%)
15216(5.6%)
9901(3.7%)
8033(3.0%)
40660(15.0%)
270330 (100.0%) 0 (0.0%)
16 DIAX [integer]
Mean (sd) : 15.7 (8.7)
min ≤ med ≤ max:
1 ≤ 16 ≤ 31
IQR (CV) : 15 (0.6)
31 distinct values 270325 (100.0%) 5 (0.0%)
17 MESX [numeric]
Mean (sd) : 6.7 (3.4)
min ≤ med ≤ max:
1 ≤ 7 ≤ 12
IQR (CV) : 6 (0.5)
12 distinct values 270325 (100.0%) 5 (0.0%)
18 AÑOX [numeric]
Mean (sd) : 2017 (1.8)
min ≤ med ≤ max:
2014 ≤ 2017 ≤ 2020
IQR (CV) : 3 (0)
2014:22352(8.3%)
2015:46066(17.0%)
2016:46990(17.4%)
2017:46105(17.1%)
2018:43300(16.0%)
2019:45795(16.9%)
2020:19717(7.3%)
270325 (100.0%) 5 (0.0%)
19 SEMANAX [numeric]
Mean (sd) : 27.3 (14.9)
min ≤ med ≤ max:
1 ≤ 28 ≤ 53
IQR (CV) : 26 (0.5)
53 distinct values 270325 (100.0%) 5 (0.0%)
20 SEMANAXX [character]
1. 31
2. 33
3. 35
4. 32
5. 28
6. 30
7. 29
8. 38
9. 37
10. 40
[ 43 others ]
6353(2.4%)
6260(2.3%)
6132(2.3%)
6087(2.3%)
5929(2.2%)
5849(2.2%)
5792(2.1%)
5762(2.1%)
5718(2.1%)
5698(2.1%)
210745(78.0%)
270325 (100.0%) 5 (0.0%)
21 DIA_SEMANA [character]
1. domingo
2. jueves
3. lunes
4. martes
5. miércoles
6. sábado
7. viernes
25945(9.6%)
40614(15.0%)
38971(14.4%)
42146(15.6%)
41048(15.2%)
38758(14.3%)
42843(15.8%)
270325 (100.0%) 5 (0.0%)
22 MES_SEMANA [character]
1. agosto
2. julio
3. septiembre
4. octubre
5. diciembre
6. noviembre
7. febrero
8. marzo
9. mayo
10. junio
[ 2 others ]
27000(10.0%)
25018(9.3%)
24128(8.9%)
23953(8.9%)
23242(8.6%)
22319(8.3%)
22214(8.2%)
21498(8.0%)
21248(7.9%)
20313(7.5%)
39392(14.6%)
270325 (100.0%) 5 (0.0%)
23 FESTIVO [numeric]
Min : 0
Mean : 0
Max : 1
0:262396(97.1%)
1:7934(2.9%)
270330 (100.0%) 0 (0.0%)
24 FLORES [numeric]
Min : 0
Mean : 0
Max : 1
0:263327(97.4%)
1:7003(2.6%)
270330 (100.0%) 0 (0.0%)
25 FUTBOL [numeric]
Min : 0
Mean : 0
Max : 1
0:267948(99.1%)
1:2382(0.9%)
270330 (100.0%) 0 (0.0%)
26 QUINCENA [numeric]
Min : 0
Mean : 0.2
Max : 1
0:227143(84.0%)
1:43187(16.0%)
270330 (100.0%) 0 (0.0%)

Generated by summarytools 1.0.0 (R version 4.0.5)
2021-11-28

Año

A continuación se observa una tabla de frecuencias para los años de los incidentes registrados en la base de datos de incidentes.

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
2014 22352 8.27 8.27 8.27 8.27
2015 46066 17.04 25.31 17.04 25.31
2016 46991 17.38 42.69 17.38 42.69
2017 46109 17.06 59.75 17.06 59.75
2018 43300 16.02 75.77 16.02 75.77
2019 45795 16.94 92.71 16.94 92.71
2020 19717 7.29 100.00 7.29 100.00
0 NA NA 0.00 100.00
Total 270330 100.00 100.00 100.00 100.00

Como se observa, los años 2015 a 2019 tienen aproximadamente la misma cantidad de observaciones en cada uno de ellos, lo cual es de esperar porque para todos ellos se cubre la totalidad del año, mientras que para los años 2014 y 2020 solo se cubre una parte de ellos. En todo caso, es interesante observar que el año en el que más accidentes se observaron fue el 2016, con 46,991 incidentes en total, lo cual representa el 17.38 % del total de observaciones. Gráficamente, se puede visualizar mediante el siguiente gráfico de barras:

Clase de accidente

La clase de accidente es una variable categórica de orden nominal que define de forma generar las características del incidente observado, de manera que esta variable puede asumir cualquiera de los siguientes niveles:

  • Choque
  • Atropello
  • Volcamiento
  • Caída del ocupante
  • Incendio
  • Otro

Teniendo esto presente, se puede definir la siguiente tabla de frecuencias para esta base de datos:

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
(Empty string) 6 0.00 0.00 0.00 0.00
Atropello 25313 9.36 9.37 9.36 9.37
Caída del ocupante 24138 8.93 18.30 8.93 18.30
Choque 180431 66.74 85.04 66.74 85.04
Incendio 35 0.01 85.05 0.01 85.05
Otro 30039 11.11 96.16 11.11 96.16
Volcamiento 10368 3.84 100.00 3.84 100.00
0 NA NA 0.00 100.00
Total 270330 100.00 100.00 100.00 100.00

De la tabla anterior se puede observar que el tipo de accidente más frecuente es el choque, pues se observaron un total de 180,431 incidentes de tráfico que involucraron a este tipo de colisiones, lo que representa al 66.75 % de los accidentes, lo cual es llamativo porque resulta más de dos terceras partes de todos los incidentes ocurridos en la ciudad de Medellín entre el año 2014 y 2020. A continuación se tienen a los incidentes que no clasifican en ninguna de las categorías propuestas por Informe Policial de Accidentes de Tránsito, IPAT, es decir, los que se etiquetan como “otro”, dado que el 11,11 % de los incidentes registrados clasifican en esta categoría. En tercer lugar se tiene a los atropellamientos que abarcan al 9.36 % de los accidentes de tránsito observados en Medellín en el periodo mencionado. Por último, vale destacar que el tipo de incidente menos frecuente de todos es el que involucra a incendios, ya que durante este periodo solo sucedieron 35 eventos de este tipo, lo cual se evidencia en el siguiente gráfico de barras, pues la barra asociada a este tipo de incidente ni siquiera es apreciable, toda vez que las colisiones opacan al resto por su alta frecuencia relativa.

Diseño

Uno de los aspectos más importantes a la hora de evaluar un incidente de tránsito es caracterizar el tipo de espacio en el que sucedió el accidente en términos de la infraestructura física, y esta característica es determinada en la base de datos en la variable “diseño”, que resulta siendo una variable categórica con un nivel nominal, y se describen los siguientes tipos de infraestructura:

  • Ciclorruta.
  • Glorieta.
  • Intersección.
  • Lote o predio.
  • Paso a nivel.
  • Paso elevado.
  • Paso inferior.
  • Pontón.
  • Puente.
  • Tramo de vía.
  • Túnel.
  • vía peatonal.

Y una tabla de frecuencias relacionada a esta variable es la siguiente:

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
(Empty string) 713 0.26 0.26 0.26 0.26
Ciclorruta 1040 0.38 0.65 0.38 0.65
Glorieta 6756 2.50 3.15 2.50 3.15
Intersección 43935 16.25 19.40 16.25 19.40
Lote o predio 27104 10.03 29.43 10.03 29.43
Paso a nivel 125 0.05 29.47 0.05 29.47
Paso elevado 1399 0.52 29.99 0.52 29.99
Paso inferior 678 0.25 30.24 0.25 30.24
Pontón 34 0.01 30.25 0.01 30.25
Puente 1064 0.39 30.65 0.39 30.65
Tramo de vía 187319 69.29 99.94 69.29 99.94
Túnel 107 0.04 99.98 0.04 99.98
Vía peatonal 56 0.02 100.00 0.02 100.00
0 NA NA 0.00 100.00
Total 270330 100.00 100.00 100.00 100.00

Revisando la tabla anterior se tiene que la infraestructura vial en la que más incidentes de tránsito sucedieron en Medellín entre el 2014 y el 2020 es el tramo de vía, pues en estos se dieron el 69,45 % del total de accidentes observados en la ciudad de Medellín en el periodo mencionado, lo cual es bastante lejano al resto de incidentes. Además, es llamativo observar que el segundo tipo de infraestructura donde más incidentes se dieron son las intersecciones, donde ocurrieron el 16.30 % de los incidentes. Además, donde menos incidentes ocurrieron fue en los pasos inferiores, ya que únicamente el 0.25 % de los accidentes ocurrieron en este tipo de vías.

Fecha

A continuación se muestra un gráfico en el que se muestra la cantidad de accidentes que se dieron en la ciudad de Medellín en cada uno de los días en los que se observaron datos. Para poder ver con mayor detalle algún periodo particular, se recomienda hacer un zoom con las herramientas que aparecen en el extremo superior derecho del gráfico.

Y del esquema anterior llama la atención que la mayoría de días se presentan entre 75y 175 accidentes por día, con algunas excepciones que se salen de estos extremos, de las cuales vale la pena mencionar que aquellas que aquellos picos superiores, es decir, fechas en las que se producen más accidentes en comparación con el resto de días, la mayoría se concentra en los meses de agosto y septiembre. Por otro lado, se debe rescatar que al comenzar cada año también se observa que ocurrencia de mínimos. También llama la atención la caída de accidentes que se presentan en la ciudad de Medellín luego del comienzo del confinamiento nacional como medida de contingencia por la pandemia de la COVID-19 el 18 de marzo de 2020.

Además, de estos datos se pueden rescatar los siguientes estadísticos, excluyendo los datos posteriores al 18 de marzo de 2020 por haber menos tránsito de vehículos que en otros días:

TOTAL
Mean 125.01
Std.Dev 28.45
Min 24.00
Q1 107.50
Median 130.00
Q3 144.00
Max 231.00
MAD 25.20
IQR 36.25
CV 0.23
Skewness -0.40
SE.Skewness 0.05
Kurtosis -0.06
N.Valid 2084.00
Pct.Valid 100.00

Y como se observa, el número promedio de accidentes por día es 125 con una desviación estándar de 28.45 accidentes diarios. Además, el día en que menos accidentes ocurrieron fue el 4 de julio de 2014, donde se dieron 24 accidentes (nótese que este es justamente el día en el que se comienzan a tomar datos), toda vez que el día con mayor accidentes fue 4 de agosto de 2021, ya que en él se registraron 234 incidentes viales en la ciudad. Por otro lado, se tiene que la mediana es de 130 accidentes por día, lo que significa que en la mitad de los días se tienen 130 incidentes o más, mientras que en la otra mitad hay 129 accidentes de tránsito o menos. Asimismo, el primer cuantil ocurre en los 107.5 accidentes por día, y el tercer cuantil está asociado a los 144 accidentes viales diarios. Finalmente, se puede observar que el índice de asimetría es -0.4, lo que significa que los datos no son perfectamente simétricos y que tienden más hacia los valores más altos de accidentalidad diarios; además, la curtosis es de -0.06, lo cual significa que la cantidad de accidentes diarios podría tener una distribución parecida a la normal, y el hecho de que sea negativo implica que hay una concentración ligeralmente mayos datos hacia la media que en una distribución normal, lo que implica que la ocurrencia de valores extremos es menos frecuente que en una distribución auténticamente normal. Respecto a estos dos últimos parámetros, resulta interesante realizar un histograma para poder observar la distribución de accidentes diarios.

Y en este se observa un gráfico que no se asemeja al de una distribución normal, empezando por el hecho de que la simetría no es muy clara y también por la presencia de dos modas, lo cual no se asemeja a una distribución normal en el sentido que esta tiene una y solo una moda. En todo caso, vale la pena realizar una prueba de hipótesis de normalidad para esta variable mediante el test de Lillifors, que es el test más potente para una alta cantidad de datos y que se basa en una modificación del test de Lillifors. Para ello, se plantean las siguientes hipótesis con un nivel de confianza del 95 % (\(\alpha = 0.05\)):

\(H_0:\) La distribución de la cantidad de accidentes por día en Medellín entre julio de 2014 y marzo de 2020 es normal.

\(H_1:\) La distribución de la cantidad de accidentes por día en Medellín entre julio de 2014 y marzo de 2020 no es normal.

Y al realizarlo con ayuda de \(\color{blue}{\textsf{R}}\) se obtiene un valor p de \(V_p < 2.2 \times 10^{-16} < 0.05 = \alpha\), lo cual permite rechazar la hipótesis nula y por tanto se concluye la cantidad de accidentes que suceden en Medellín por día no tienen una distribución normal.

Ahora bien, para poder tener una mejor visibilidad, se va a hacer la suma de accidentes diarios pero presentados por mes.

Y en esta se puede constatar lo que ya se había mencionado previamente y es que existen mínimos en los meses de enero y máximos en los meses de agosto. Además, llama la atención que hay comportamiento aproximadamente uniforme en todos los años, salvo en el 2019, donde el pico del mes de agosto se preserva para los meses de septiembre y octubre. Además, se debe observar que en febrero del año 2020 se tiene un comportamiento semejante al de año previos hasta el mes de marzo, donde se da inicio al confinamiento nacional por cuenta de la pandemia del virus de la COVID-19. De aquí se pueden obtener los siguientes estadísticos excluyendo los valores posteriores a marzo de 2020:

Total mes
Mean 3800.31
Std.Dev 281.27
Min 3142.00
Q1 3608.00
Median 3832.00
Q3 3985.50
Max 4405.00
MAD 290.59
IQR 375.25
CV 0.07
Skewness -0.14
SE.Skewness 0.29
Kurtosis -0.38
N.Valid 68.00
Pct.Valid 100.00

Y de lo anterior se sigue que la cantidad de accidentes promedio por mes es de 3,800, con una desviación estándar 281.27 accidentes mensuales. Además, se observa que el mínimo es de 3,142 accidentes mensuales, lo cual ocurre en junio de 2019; toda vez que el máximo es de 4,405 accidentes mensuales asociado a agosto de 2019. Además, la mediana es de 3,832 accidentes mensuales, lo que quiere decir que en al menos la mitad de los meses de los cuales hay registros cuentan con al menos 3,832 accidentes mensuales observados, toda vez que en la otra mitad se observaron una cantidad inferior de accidentes.

Mapa de calor

A continuación se observa un mapa de calor para la cantidad de accidentes observados por día.

En este resalta inicialmente quea partir del mes de marza de 2020 la cantidad de accidentes registrada por día en la última quincena de marzo y en el mes de abril es muy baja, toda vez que a medida que se va permitiendo la apertura de ciertos sectores económicos fue aumentado progresivamente la acidentalidad. Además, llama la atención que es en el mes de agosto donde se tienen más colores naranjas y oscuras, lo cual indica una alta cantidad de accidentailidad, mientras que en la primera quincena de enera predominan colores suaves y verdosos, que se asocian a bajas tasas de accidentalidad.

Mes

Ahora se va a realizar la evaluación de la cantidad de accidentes viales ocurridos en la ciudad de Medellín según el mes sin importar el año, para lo cual se puede realizar la siguiente tabla de frecuencias:

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
Abril 19293 7.14 7.14 7.14 7.14
Agosto 27001 9.99 17.12 9.99 17.12
Diciembre 23243 8.60 25.72 8.60 25.72
Enero 20098 7.43 33.16 7.43 33.16
Febero 22214 8.22 41.37 8.22 41.37
Julio 25018 9.25 50.63 9.25 50.63
Junio 20314 7.51 58.14 7.51 58.14
Marzo 21499 7.95 66.10 7.95 66.10
Mayo 21249 7.86 73.96 7.86 73.96
Noviembre 22319 8.26 82.21 8.26 82.21
Octubre 23953 8.86 91.07 8.86 91.07
Septiembre 24129 8.93 100.00 8.93 100.00
0 NA NA 0.00 100.00
Total 270330 100.00 100.00 100.00 100.00

La cual se puede acompañar del siguiente gráfico de barras.

Y como se observa, el mes en el que más accidentes se registran es agosto, que cuenta con 27,001 accidentes observados en dicho mes, seguido por 25,018 incidentes viales que ocurrieron durante los diferentes meses de julio, y en tercer lugar se tiene al mes de septiembre que registra a 24,129 accidentes. Además, los dos meses con menos incidentes viales registrados son enero con 20,098 incidentes viales y abril con 19,293 accidentes. Finalmente, es llamativo notar que los seis últimos meses del año se reparten los seis primeros lugares y que los meses del primer semestre hacen lo propio con los últimos seis puestos.

Comuna

A continución se visualiza la tabla de frecuencias para la cantidad de incidentes de tránsito registrados en las dieciséis comunas y cinco corregimientos de la ciudad de Medellín:

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
Altavista 457 0.17 0.17 0.17 0.17
Aranjuez 15216 5.63 5.80 5.63 5.80
Belén 18674 6.91 12.71 6.91 12.71
Buenos Aires 9901 3.66 16.37 3.66 16.37
Castilla 25831 9.56 25.92 9.56 25.92
Doce de Octubre 6878 2.54 28.47 2.54 28.47
El Poblado 21736 8.04 36.51 8.04 36.51
Guayabal 18464 6.83 43.34 6.83 43.34
La América 8033 2.97 46.31 2.97 46.31
La Candelaria 67352 24.91 71.22 24.91 71.22
Laureles - Estadio 27978 10.35 81.57 10.35 81.57
Popular 3822 1.41 82.99 1.41 82.99
Robledo 16485 6.10 89.09 6.10 89.09
San Antonio de Prado 4007 1.48 90.57 1.48 90.57
San Cristóbal 2756 1.02 91.59 1.02 91.59
San Javier 4313 1.60 93.18 1.60 93.18
San Sebastián de Palmitas 17 0.01 93.19 0.01 93.19
Santa Cruz 3437 1.27 94.46 1.27 94.46
Santa Elena 487 0.18 94.64 0.18 94.64
Santa Manrique 7775 2.88 97.52 2.88 97.52
Villa Hermosa 6711 2.48 100.00 2.48 100.00
0 NA NA 0.00 100.00
Total 270330 100.00 100.00 100.00 100.00

Y se acompaña con el siguiente gráfico de barras:

De los esquemas anteriores llama la atención que la comuna en la que más incidentes viales ocurren es en La Candelaria, que es la comuna central de la ciudad de Medellín y que concentra a la mayoría de las sedes de instituciones públicas municipales, departamentales nacionales, así como múltiples negocios y empresas que requieren una ingente cantidad de trabajadores y asimismo atrae a miles de consumidores diariamente. Así, se tiene que en dicha comuna se dan 67,352 incidentes viales o 24.91 % del total, lo que significa que casi uno de cada cuatro accidentes suceden en la comuna de La Candelaria. A continuación, se tiene a la comuna de Laureles-Estadio, la cual registró 27,978 incidentes viales en su territorio. En el otro extremo se tiene que los cuatro territorios en los que menos incidentes viales son corregimientos, en orden de mayor a menor: San Cristóbal (2,758 accidentes de tránsito), Santa Elena (487 accidentes de tránsito), Alta Vista (457 incidentes de tránsito) y San Sebastián de Palmitas (17 incidentes de tránsito), teniendo esta última 457 accidentes de tránsito. Adicionalmente, llama la atención que el corregimiento de San Antonio de Prado, que sumó 4,313 accidentes de tránsito, tuvo más incidentes que dos comunas: Popular (3,822 incidentes de tránsito) y Santa Cruz (3,437 accidentes de tránsito).

Barrio

Respecto a los barrios, se tiene que los barrios en los que más accidentes de tránsito son Corazón de Jesús (La Candelaria) con 16,084 accidentes de tránsito, La Candelaria (La Candelaria) coon 5,915 accidentes de tránsito y Caribe (Castilla) con 5,619 incidentes de tránsito en total, siendo el último caracterizado por estar en las inmediaciones de la Terminal de Transportes Norte de la ciudad de Medellín, así como varios intercambios hacia los cuatro puntos cardinales de la ciudad, así como salidas hacia la autopista Medellín - Bogotá y vías que van hacia el Caribe colombiano y hacia el occidente antioqueño.